# 匹配所有的汉字:中文的unicode编码范围主要在[u4e00-u9fa5],虽不完整但够用
import re

title = '你好, hello, 世界'
pattern = re.compile(r'[\u4e00-\u9fa5]+')
result = re.findall(pattern, title)
print(result)                           # ['你好', '世界']